DAY20 語音辨識的前端—VAD篇 part1

2023 iThome 鐵人賽

DAY 20

AI & Data

15th鐵人賽

4183 瀏覽

你好！

前言

VAD 是 "Voice Activity Detection" 的縮寫，翻譯成中文為 "語音活動檢測"。它是一個在語音處理中常用的技術，用於檢測語音信號中是否存在語音活動，以及識別語音活動和非語音活動的時間段。

VAD 的主要用途和優勢包括：

VAD 的實現方式有多種，包括基於能量閾值、基於語音特徵的方法（如倒譜係數、短時能量等），以及機器學習方法（如神經網絡）。這些方法通常根據具體應用的需求和環境來選擇。

總之，VAD 是一個用於檢測語音活動的重要技術，它在語音處理和通信中有多種實際應用，有助於提高語音品質、節省資源和改進語音識別性能，明天會更深入的提及VAD的三大巨頭，敬請期待～

參考書籍：Hey Siri及Ok Google原理：AI語音辨識專案真應用開發
參考網站：今日無
學習對象：ChatGPT

系列文

AI與語音辨識共 30 篇

3 人訂閱

完整目錄

熱門推薦

{{ item.channelVendor }} | {{ item.webinarstarted }} |

直播中

立即登入留言

參賽組數

902 組

團體組數

37 組

累計文章數

19837 篇

完賽人數

528 人

IT邦幫忙